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摘要 : 【 目的】 针对 PageRank 算法 在 符号 网 络 中 的 局 限 性 , 提出 其 改进 算法 ,以 识别 社会 网 络 中 的 关键 节点 。 
【方法 】 基 于 符号 网 络 的 相关 理论 , 将 PageRank 算法 与 点 度 中 心性 相 结 合 , 提出 KeyRank 算法 , 并 对 Slashdot 
网 站 的 用 户 数据 进行 分 析 , 以 获取 用 户 的 KeyRank 算法 排名 。[ 结果 ] PageRank 算法 排名 、 入 度 排名 、M-PR 算 
法 排名 与 KeyRank 算法 排名 在 统计 学 意义 上 呈 中 度 正 相关 。[ 局 限 ] KeyRank 算法 忽略 了 每 次 迭代 时 正 、 负 和 链 


接 的 相互 作用 。[ 结论 ] 传统 算法 与 KeyRank 算法 在 节点 排序 上 存在 差异 , 说 明 链 接 的 符号 属性 对 排序 结果 产生 


了 重要 影响 , 改进 算法 具有 一 定 的 理论 和 实践 意义 。 
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1 3 引 


随 着 互联 网 技术 的 迅速 发 展 和 社会 化 媒体 的 大 规 
模 普 及 , 在 线 社交 媒体 的 用 户 数量 、 整 体 规模 得 到 显 
著 提升 , 对 社会 化 媒体 的 研究 也 从 用 户 个 体 向 用 户 之 
间 相 互 关 联 所 形成 的 网 络 拓扑 结构 延伸 。 

在 众多 有 关 社 会 网 络 的 研究 中 ， 如 何 准 确 计算 网 
络 中 节点 的 影响 力 一 直 是 学 者 关注 的 重点 , 而 在 获取 
影响 力 的 基础 上 , 挖掘 和 识别 其 中 的 关键 节点 则 是 对 
社会 网 络 更 深层 次 的 探索 。 然 而 在 传统 的 社会 网 络 分 
析 中 , 研究 者 大 多 默认 网 络 节点 之 间 若 存在 关系 ， 则 
均 为 正 向 关系 , 即 支持 、 关 注 、 合 作 等 “ 示 好 ”关系 中) 
因此 ,相关 研究 也 普遍 基于 这 种 仅 存 在 正 向 关系 的 网 
络 结构 识别 关键 节点 , 并 未 充分 考虑 边 值 的 正 负 属性 
对 研究 结果 的 影响 。 随 着 社会 网 络 研 究 层次 的 逐渐 深 
入 , 一 些 研究 者 在 对 真实 社会 关系 网 络 进 行 分 析 的 过 
程 中 发 现 , 节点 之 间 除 了 存在 正 向 、 积 极 的 友好 关系 
外 , 还 可 能 包含 负 向 、 消 极 的 对 立 关系 , 其 表达 了 一 方 
对 男 一 方 的 厌恶 、 反 对 等 负面 态度 外 这 类 同时 包含 
“ 正 向 关系 *( 如 顶 、 支 持 、 肯 定 、 点 赞 等 ) 和 “ 负 向 关 


了 中 


系 "( 如 踩 、 反 对 、 否 认 、 拉 黑 等 ) 的 社会 网 络 结构 ， 被 
统称 为 “符号 网 络 ”(Signed Network) 中 。 符 号 网 络 提出 
至 今 , 在 人 际 关系 、 国 际 政治 、 信 号 传输 等 领域 均 有 
广泛 应 用 , 其 节点 间 关 系 的 正 负 属性 能 够 更 为 客观 地 
反映 现实 情况 中 的 社会 网 络 结构 。 在 对 节点 影响 力 测 
算 的 过 程 中, 将 负 向 链接 所 传递 的 消极 倾向 纳入 考虑 
范畴 ， 分 析 节 点 负 影 响 力 产生 的 影响 , 更 有 利于 掌握 
社会 网 络 整 体 结 构 的 动态 演化 , 并 提高 识别 关键 节点 
的 准确 性 与 合理 性 。 

此 , 本 文 基于 社会 网 络 的 链接 特征 ,在 综合 考虑 
节点 间 正 负 向 关联 的 基础 上 , 提出 一 种 改进 的 PageRank 
算法 来 识别 网 络 中 的 关键 节点 。 较 之 传统 的 识别 算法 ， 
本 文 提出 的 KeyRank 算 法 全 面 考察 了 网 络 链接 的 正 负 
属性 ， 并 综合 考虑 节点 的 全 局 拓扑 特性 和 局 部 特征 ， 
从 而 能 够 更 为 准确 地 识别 出 其 中 的 关键 节点 ， 为 基于 
符号 网 络 的 关键 节点 识别 提供 思路 和 帮助 。 


2 相关 研究 


关键 节点 识别 作为 社会 网 络 分 析 的 关键 问题 之 
一 ， 自 20 世纪 初期 以 来 便 被 研究 者 所 关注 外 。 在 信息 
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科学 领域 , 随 着 对 社会 化 媒体 中 信息 传播 和 与 论 扩散 
问题 研究 的 深入 , 关于 网 络 中 关键 节点 的 识别 和 挖掘 
也 逐渐 成 为 研究 的 热点 。 关 键 节 点 的 位 置 及 特征 对 社 
会 网 络 中 信息 的 传递 路 径 、 传 播 速度 、 和 覆盖 范围 等 有 
着 重要 影响 岂 ， 这 些 节点 在 网 络 结构 动态 演化 、 舆 情 传 
播 控 制 等 研究 中 都 发 挥 着 重要 作用 外, 因此， 如何 快速 
准确 地 查找 到 网 络 中 的 关键 节点 ,， 是 研究 社会 网 络 拓 
扑 结构 和 信息 传播 规律 的 必要 环节 。 

社会 网 络 中 关键 节点 的 识别 方法 可 以 分 为 两 类 : 
主观 估 测 和 客观 度量 。 

(1) 主观 估 测 是 传统 环境 下 关键 节点 识别 的 常用 
手段 , 主要 包括 自我 报告 法 、 知 情人 测量 法 和 观察 法 中 
在 社会 学 和 传播 学 领域 ,自我 报告 法 是 一 种 用 于 测度 
意见 领袖 影响 力 的 有 效 方法 , 该 方法 基于 设计 的 调查 
量 表 , 让 受 访 者 根据 实际 情况 作答 ,最 后 通过 计算 回 
答 分 值 识 别 社会 网 络 中 的 关键 人 物 (”1; 与 自我 报告 
法 相对 应 的 是 知情 人 测量 法 , 该 方法 通过 询问 他 人 而 
非 自 我 识别 网 络 中 具有 影响 力 的 关键 节点 02; 而 观察 
法 则 通过 观察 研究 对 象 在 网 络 中 的 行为 特征 判定 其 重 
要 性 。 经 过 Rogers 、King 、Childers 及 Flynn 等 学 者 的 
发 展 和 完善 ,这 些 方法 在 社会 科学 各 领域 的 研究 中 已 
被 广泛 接受 和 应 用 司 ]。 主 观 估 测 作为 一 种 识别 和 评估 
关键 节点 的 经 典 手段 , 却 存在 不 适用 于 大 规模 网 络 和 
主观 性 较 强 等 缺陷 因此 , 近年 来 涌现 出 大 量 以 客观 
数据 为 基础 的 研究 成 果 ， 以 作为 对 关键 节点 识别 方法 
的 重要 补充 。 

(2) 客观 度量 是 基于 网 络 节点 及 节点 间 关 系 等 数 
据 ， 采 用 社会 网 络 分 析 、 聚 类 分 析 、HITS 算法 、 
PageRank 算法 、 数 学 建 模 等 方法 来 识别 关键 节点 。 如 
陈 远 等 以 科学 网 博客 社区 为 研究 对 象 , 运用 社会 网 络 
分 析 法 , 分 别 构建 博 主 好 友 关 系 网 络 和 引文 关系 网 络 ， 
分 析 网 络 的 节点 中 心性 和 结构 洞 位 置 ， 得 出 关键 节点 
与 社会 网 络 中 位 置 的 关系 卢 ; 王 球 等 以 国内 某 论 坛 为 
研究 对 象 , 引入 7 个 特征 值 来 度量 意见 领袖 特性 ， 提 
出 基于 EM 算法 的 意见 领袖 识别 算法 ,并 通过 聚 类 结 
果 得 到 满足 要 求 的 子 类 0; 熊 涛 等 通过 改进 的 HITS 
算法 识别 微 博 转发 网 络 中 的 意见 领袖 ， 并 发 现 粉丝 数 
量 与 意见 领袖 的 中 心 值 高 度 正 相 关 [9; 肖 字 等 提出 基 
于 无 向 、 有 权 网 络 识别 关键 节点 的 PageRank 算法 , 并 
以 某 论 坛 历史 数据 为 例 , 验证 其 相 比 于 其 他 算法 具备 
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更 高 的 准确 性 1; Matumura 等 提出 的 影响 力 扩 散 模 型 
(Influence Diffusion Model) 是 利用 数学 建 模 识别 关键 
节点 的 主要 代表 ,其 通过 文本 内 容 的 相似 度 度量 用 户 
影响 力 , 认为 论坛 中 高 影响 力 的 节点 为 意见 领袖 史 。 

然而 ， 上述 关键 节点 识别 的 研究 基础 均 为 单一 符 
号 性 质 的 网 络 环境 , 未 对 负 向 链接 和 缺失 链接 进行 区 
分 , 与 现实 情境 中 市 点 间 链 接 具 有 正 负 特性 的 情况 并 
不 相符 , 不 能 真实 、 客 观 地 反映 社会 关系 网 络 。 因 此 ， 
这 类 基于 无 符号 网 络 的 概念 、 算 法 及 相关 理论 不 能 直 
接应 用 到 同时 包含 正 、 负 链接 的 符号 网 络 中 , 研究 者 
需要 设计 更 具 针 对 性 的 排序 算法 以 挖掘 符号 网 络 中 的 
关键 节点 站。 

针对 上 述 问 题 , 已 有 学 者 基于 符号 网 络 环境 开展 
了 相关 人 研究。 识别 符号 网 络 中 的 关键 节点 可 基于 网 络 
的 链接 结构 , 通过 考虑 正 问 链 接 和 人 负 向 链接 对 网 络 中 
的 一 组 节点 进行 排序 2， 排名 较 优 的 可 认为 是 关键 节 
点 。 因 此 , 现 有 研究 多 从 不 同 的 角度 考虑 链接 属性 对 
节点 的 影响 ， 从 而 对 无 符号 网 络 中 的 关键 节点 识别 算 
法 进行 改进 。Bonacich 等 基于 社会 网 络 分 析 法 , 提出 
一 种 度量 符号 网 络 特征 向 量 中 心性 的 方法 ,并 以 此 分 
析 修 道士 网 络 的 派系 结构 及 关键 节点 ”Li 等 提出 一 
个 从 用 户 生 成 内 容 中 提取 情感 属性 的 框架 ， 并 以 此 构 
建 符号 网 络 , 同时 , 通过 到 类 算法 挖掘 虚拟 社区 中 的 
意见 领袖 请; Mishra 等 基于 HITS 算法 , 考虑 负 向 链接 
的 有 影响, 提出 一 种 新 的 算法 来 度量 信任 网 络 中 节点 的 
偏好 性 与 权威 性 中 ;Traag 等 基于 离散 选择 理论 
(Discrete Choice Theory), 考虑 负 癌 链接 对 节点 排名 的 
影响 ,同时 借鉴 PageRank 算法 的 思想 , 提出 “指数 排 
名 ”算法 ,进而 获得 节点 在 网 络 中 的 全 局 可 信和 度 R 与 
国外 研究 相 比 ,国内 关于 符号 网 络 关 键 节 点 识别 的 研 
究 还 相对 较 少 。 顾 洁 等 探究 符号 网 络 环境 下 节点 影响 
力 的 测算 方式 , 提出 一 种 改进 的 PageRank 算法 , 该 算法 
将 节点 被 正 负 链接 指向 的 概率 考虑 在 内 , 分别 计算 其 在 
社交 网 络 中 的 正 、 负 影响 力 ， 以 识别 关键 节点 中 1。 

综 上 所 述 , 前 人 研究 多 以 无 符号 网 络 环境 作为 关 
键 节 点 识别 的 研究 基础 ， 基 于 符号 网 络 环境 的 研究 相 
对 较 少 。 因 此 , 本 文 将 PageRank 算法 这 一 重要 的 关键 
节点 识别 算法 引入 到 符号 网 络 中 , 通过 将 其 与 反映 节 
点 局 部 特征 的 点 度 中 心性 相 结合 ,提出 KeyRank 算 法 ， 
以 挖掘 符号 网 络 中 的 关键 节点 。 
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3 ”基于 符号 网 络 的 PageRank 算法 改进 


Larry Page 和 Sergey Brin 于 1998 年 提出 的 
PageRank 算法 是 评估 网 站 页 面 重要 性 的 经 典 算法 , 其 
认为 网 络 环境 下 的 网 页 链接 结构 和 文献 引文 机 制 具 有 
一 定 的 相似 性 ,从 而 将 网 页 中 的 链接 类 比 于 文献 之 间 
的 引用 关系 中 。PageRank 算法 的 基本 原理 是 “被 越 多 
高 影响 力 的 网 页 指向 , 则 该 网 页 的 影响 力 越 高 ”。 例 如 ， 
当 网 页 A 链接 到 网 页 B 时 就 说 明 网 页 A 为 网 页 B 投 
票 , 增加 了 网 页 B 的 影响 力 ， 即 PageRank 值 , 通过 对 
整个 网 络 的 迭代 计算 , 最 终 获得 每 个 网 页 的 PageRank 
值 及 相应 的 排名 71。 

3.1 基于 符号 网 络 的 PageRank 算法 

PageRank 算法 也 是 符号 网 络 研 究 中 最 早 使 用 的 
排序 方法 之 一 ， 其 中 ，Shahriari 和 Jalili 将 符号 网 络 划 
分 为 G “( 正 向 链接 子 图 ) 和 G ( 负 向 链接 子 图 ) 两 个 部 
分 , 并 基于 PageRank 算 法 分 别 计算 两 个 子 图 中 各 节点 
的 PageRank 值 *， 如 公式 (1) 和 公式 (2) 所 示 。 


PRi(t) 1-a 

PR (t+1)=0Y jw 一 一 -+ 一 一 (1) 
Sm ou | N 
PRi(t) 1- 

PR (+L) = aD jew OD le (2) 


Our WN 
其 中 ,IWN; 表 示 节 点 i 的 入 链 数 ，| Out} | 和 | Outi | 
表示 节点 j 的 正 向 出 链 数 和 负 向 出 链 数 , 表示 节点 总 
数 ，c 表示 阻尼 系数 , 一 般 取 值 为 0.85。 最 终 排 序 向 


量 PR 计算 方法 如 公式 (3) 所 示 。 
PR= PR+ ~ PR- G) 

虽然 PageRank 算法 考虑 到 网 络 的 全 局 拓扑 特性 ， 
然而 该 算法 忽略 了 网 络 中 节点 自身 的 属性 9。 从 拓扑 
结构 角度 考虑 ，PageRank 算法 弱化 了 局 部 属性 对 节点 
的 影响 。 点 度 中 心 度 被 定义 为 网 络 中 该 节点 的 邻居 节 
点 的 数目 , 用 于 反映 一 个 节点 在 网 络 中 的 “权力 i) 
点 度 中 心 度 越 大 说 明 节 点 在 当前 网 络 中 的 直接 影响 力 
越 大 , 例如 , 被 引 次 数 较 多 的 论文 往往 比较 重要 ， 微 
博 中 拥有 较 多 粉丝 数 的 用 户 影 响 力也 往往 较 大 。 然 而 ， 
PageRank 算法 在 计算 节点 的 重要 性 时 ， 虽 然 同 时 考虑 
了 外 部 链接 的 数量 和 质量 , 但 也 在 一 定 程 度 上 削弱 了 
邻居 节点 数量 这 一 局 部 属性 对 节点 的 影响 。 图 1 提取 
自 某 社交 网 络 , 根据 PageRank 算法 ,和 若 阻 尼 系 数 
0 =085, 则 PRO) = 0.2971, PR(2)=0.1853, PR(O) > 
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PR(2) ,说 明 节 点 1 比 节点 2 重要 ; 而 根据 节点 人 度 的 
计算 方法 ， InDegreell)=2 ， InDegree(2)=5 ， 
JnDegreel(l) < InDegree(2), 说 明 节 点 2 比 节点 1 重要 。 
可 见 , 在 该 网 络 中 ，PageRank 算法 在 一 定 程度 上 弱化 
了 入 链 数 对 节点 的 影响 。 


图 1 茶社 交 网 络 图 


在 符号 网 络 中 , 节点 的 局 部 特性 对 识别 该 节点 是 
否 为 关键 节点 具有 重要 意义 。 从 内 容 特 征 角 度 考虑 ， 
用 户 更 喜欢 与 朋友 的 朋友 而 不 是 朋友 的 敌人 建立 正 向 
链接 ; 积极 的 用 户 更 容易 获取 社会 的 文 持 ,更 可 能 和 
正 向 链接 指向 59; 用 户 更 容易 同 与 他 们 相似 的 人 建立 
正 向 链接 }; 低地 位 等 级 用 户 更 可 能 与 高 地 位 等 级 用 
户 建立 正 向 链接 5 。 而 在 社会 网 络 情境 中 ,朋友 和 积 
极 的 、 相 似 的 、 高 地 位 的 用 户 在 网 络 中 一 般 可 以 认为 
是 重要 的 、 有 影响 的 关键 节点 。 因 此 , 符号 网 络 中 节 
点 的 入 链 数 和 入 链 性 质 等 局 部 特性 同样 是 识别 关键 节 
点 的 重要 因素 。 

3.2 ”基于 PageRank 的 改进 算法 一 一 KeyRank 算 法 

地 位 理论 认为 链接 的 符号 决定 了 节点 地 位 的 差 
异 , 一 条 由 i 到 jj 的 正 向 链接 太 表 示 i 认为 具有 较 高 
的 地 位 , 而 负 向 链接 万 表示 i 认为 j 具有 较 低 的 地 位 5 。 
因此 , 一 般 认为 正 问 链接 入 度 有 助 于 提升 节点 的 地 位 ， 
而 负 向 链接 入 度 则 会 降低 节点 的 地 位 站。 然而 ,在 一 
些 情景 中 , 被 负 问 链接 指向 的 节点 也 可 能 成 为 关键 节 
点 ， 如 识别 网 络 谣言 .虚假 信息 时 , 需要 对 网 络 节点 负 

可 影响 力 进行 排名 计算 , 便于 管理 者 快速 发 现 虚 假 信 
息 ， 实 现 精确 化 辟谣 号 ]。 
为 识别 社会 网 络 环境 中 的 关键 节点 , 针对 PageRank 


算法 在 符号 网 络 中 弱化 了 局 部 属性 对 节点 的 影响 这 一 
局 限 , 笔者 提出 KeyRank 算法 。 

(1) 基于 PageRank 算法 思想 , 分 别 定义 节点 i 在 
正 向 链接 网 络 和 负 向 链接 网 络 中 的 PageRank 值 PR 
和 PR ,计算 方法 如 公式 (4) 和 公式 (5) 所 示 。 


PR7 1-a 

PR = 0 一 一 + 一 一 (4) 
2 JN3 | Outt| N 
PR; 1-a 

PR =02, 7 (5) 


JE | Outj | N 


其 中 ，JN; 和 AN; 表示 节点 i 的 正 向 入 链 数 和 负 
向 人 链 数 。 

(2) 在 PR 和 PR 基础 上 , 将 其 与 反映 网 络 局 部 
特征 的 点 度 中 心 度 结合 ,考虑 人 度 对 节点 的 影响 ,从 
而 定义 节点 ;在 正 向 链接 网 络 和 负 向 链接 网 络 中 的 影响 
力 值 PP 和 NP, 计算 方法 如 公式 (6) 和 公式 (7) 所 示 。 

PPR=(PRI) Im | A (6) 
NP =(PRI) IT | 7 (7) 

其 中 ，| In | 和 | 1n; | 表示 节点 i 的 正 向 链接 入 度 
和 人 负 向 链接 入 度 , 参数 6 e[0,1]， 用 于 调节 不 同情 境 
下 PageRank 值 与 人 度 对 关键 节点 识别 影响 的 比例 。 当 
=1 时 , PP; 和 NP; 退化 为 PageRank 值 ; 当 = 0 时， 
PP 和 NP; 退化 为 节点 的 人 度 。 

(3) 一 般 地 , 定义 节点 i 的 重要 度 KeyRank;, 用 于 
识别 关键 节点 , 计算 方法 如 公式 (8) 所 示 。 

KeyRank; = PP — NP (8) 

KeyRank; 越 大 ,表示 节点 越 重要 、 影 响 力 越 大 、 
地 位 越 高 。 

但 不 是 所 有 的 情景 都 认为 负 向 链接 不 重要 ,如 识 
别 争 议 人 物 、 负 面 信息 时 , 负 向 链接 同 正 向 链接 一 样 
重要 ， 此 时 , 需 重 新 定义 KeyRank,， 同 时 定义 节点 i 的 
情感 倾向 EmotionRank, ， 计 算 方 法 如 公式 (9) 和 公式 
(10) 所 示 。 


KeyRank, = PP + NP (9) 
EmotionRank; = PP — NP (10) 
KeyRank; 越 大 ,表示 节点 越 重要 、 影 响 力 越 大 、 
地 位 越 高 ，EmotionRank, > 0， 表示 节点 i 的 情感 为 正 ， 
该 值 越 大 说 明 节 点 i 的 正 向 情感 越 强烈 ; 
EmotionRank; < 0， 表示 节点 i 的 情感 为 负 ，, 该 值 越 小 
说 明 节 点 i 的 负 向 情感 越 强烈 。 


4 实证 研究 


4.1 实验 数据 
国外 学 者 针对 符号 网 络 的 研究 数据 主要 来 自 于 商 
品评 论 网 站 Epinions 、 科 技 资讯 评论 网 站 Slashdot 以 
及 协同 编辑 在 线 百 科 全 书 Wikipedia 等 5 区。 本 文选 取 
Slashdot 网 站 的 社交 数据 , 该 网 站 提供 的 Slashdot Zoo 
功能 可 以 让 用 户 将 他 人 标记 为 “朋友 ?或 者 “敌人 ”从 
而 构建 了 同时 包含 正 向 链接 与 负 向 链接 的 符号 网 络 结 
构 。 实 验 数据 来 自 斯 坦 福 网 络 数据 库 (SNAP)， 所 选取 
的 数据 集 包 含 了 Slashdot 网 站 截至 2009 年 2 月 21 日 
的 社交 网 络 数据 , 共有 82 144 个 节点 和 549 202 组 关 
联 信息 局。 
4.2 ”基于 KeyRank 算法 的 实验 结果 

基于 KeyRank 算法 , 根据 公式 (4)- 公 式 (8), 令 
gg=0.85 ,分 别 计算 8 在 不 同 取 值 时 各 节点 的 
KeyRank 值 ， 并 进行 排名 。 表 1 列 出 了 在 =0、 
B=0.25、B=0.5、B=0.75 和 B=1 时 ,Slashdot 数据 
集中 排 在 前 20 位 的 节点 。 其 中 , 当 = 0 时 , 结果 即 
为 基于 符号 网 络 的 节点 入 度 排名 ; 当 B =1 时 , 结果 即 
为 基于 符号 网 络 的 PageRank 值 排名 。 
表 1 各 节点 的 KeyRank 排名 结果 (前 20 名 ) 


Rank B=0 B=025 B=05 B=075 B=1 
1 937 937 937 90 90 
2 1935 1935 90 937 937 
3 90 90 1935 1 935 1 935 
4 531 531 1 485 1 485 1 485 
5 1485 1485 531 1 930 1 930 
6 1930433 1930 1930 531 1 635 
7 一 2208 2208 1 635 198 
8 2208 1635 1 635 2 208 2 208 
9 179 179 179 59 531 
10 5 128 59 59 179 59 
11 928 7821 7821 198 179 
12 1802 1802 1 802 7 821 7 821 
13 7 821 433 928 1 802 1 050 
14 1 635 928 686 1 050 1 802 
15 686 686 2023 176 176 
16 534 5363 678 686 686 
17 5363 2023 433 928 2 023 
18 59 678 5363 2 023 928 
19 9835 5128 176 678 678 
20 10 762 534 198 5 363 1 953 
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为 探究 8 在 不 同 取 值 时 各 排名 之 间 的 关系 ,对 排 
名 结果 进行 Kendall’s tau-b 相关 系数 检验 。 由 于 网 络 中 
存在 大 量 入 度 为 0 的 节点 , 为 避免 其 对 分 析 结 果 造 成 
干扰 ， 故 先 将 这 些 数 据 吻 除 后 再 进行 分 析 , 结果 如 表 
2 所 示 。 根 据 各 排名 结果 的 相关 系数 矩阵 可 知 ， 当 6 取 
值 越 相 近 时 ,其 排名 结果 越 一 致 ;， 当 =0 与 p=1 时 ， 
其 排名 结果 的 相关 系数 最 低 , + = 0.5857 ,说 明基 于 符 
号 网 络 的 节点 人 度 排名 和 PageRank 值 排名 在 统计 学 
意义 上 呈 中 度 正 相关 ,两 种 算法 存在 一 定 差异 。 

表 2 各 排名 结果 的 相关 系数 矩阵 


B 值 0 0.25 0.5 0.75 1 
0 1 0.8763 0.7746 0.6486 0.5857 
0.25 0.8763 1 0.9070 0.7918 0.7050 
0.5 0.7746 ”0.9070 1 0.8847 0.7459 
0.75 0.6486 0.7918 0.8847 1 0.7640 
1 0.5857 0.7050 0.7459 0.7640 1 


(* 显 著 性 p 值 均 远 小 于 0.05。) 


4.3 ”传统 算法 与 KeyRank 算法 的 比较 

为 比较 传统 算法 与 KeyRank 算 法 在 排名 结果 上 的 
差异 ， 本 文 对 无 符号 网 络 中 各 节点 的 PageRank 值 和 入 
度 进行 分 析 ，, 同 时, 将 Shahriari 和 Jalili 所 提出 的 改进 
算法 (Modified PageRank, M-PR) 作 为 比较 对 象 。 

在 传统 研究 中 ,研究 者 更 加 关注 网 络 中 那些 正 
向 、 积 极 的 链接 ,因此 , 在 计算 节点 影响 力 时 仅 考虑 了 
符号 网 络 中 正 向 链接 子 图 G 的 影响 , 不 对 负 向 链接 
和 缺失 链接 进行 区 分 S14。 以 信息 科学 领域 为 例 ， 引文 
网 络 中 的 合作 关系 、 引 用 关系 , 社交 网 络 中 的 朋友 关 
系 、 支 持 关 系 , 均 为 正 向 链接 , 因此, 可 提取 网 络 中 的 
正 向 链接 子 图 ， 以 实现 符号 网 络 的 无 符号 化 。 此 外 , 为 
实现 符号 网 络 的 无 符号 化 , 也 有 学 者 将 符号 网 络 中 的 
正 向 链接 和 人 负 向 链接 视 为 同 质 的 链接 站。 以 信息 科学 
领域 为 例 ， 在线 投 票 网 站 的 投票 者 之 间 意 见 无 论 相 同 
或 相左 , 电 商 网 站 中 用 户 对 商品 的 评论 无 论 好 评 或 差 
评 ， 都 视 作 存在 关系 。 综 上 所 述 , 本 文 分 别 采 用 以 上 两 
种 方式 对 Slashdot 网 络 中 的 链接 进行 无 符号 化 处 理 。 
将 剔除 了 负 向 链接 的 Slashdot 网 络 记 为 Network 
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Kendall's tau-b 相关 系数 检验 ,结果 如 表 3 和 表 4 所 示 。 
可 知 , PageRank 算法 排名 、 入 度 排名 、M-PR 算法 排名 
与 KeyRank 算法 排名 在 统计 学 意义 上 旦 中 度 正 相关 ， 
说 明 传 统 算法 与 KeyRank 算法 在 节点 排序 上 存在 差 
异 ; 此 外 , M-PR 算法 与 KeyRank 算 法 在 排序 结果 上 的 
相关 系数 较 高 ,， 说明 考 虑 了 网 络 正 、 负 链接 影响 的 算 
法 在 排序 结果 上 具有 一 致 性 。 
表 3 基于 Network A 的 相关 系数 和 矩阵 


PageRank Indegree M-PR KeyRank 
PageRank 1 0.5545 0.7607 0.5417 
Indegree 0.5545 1 0.3562 0.4547 
M-PR 0.7607 0.3562 1 0.7022 
KeyRank 0.5417 0.4547 0.7022 1 


(* 显 著 性 p 值 均 远 小 于 0.05。) 


表 4 基于 Network B 的 相关 系数 矩阵 


PageRank Indegree M-PR KeyRank 
PageRank 1 0.5709 0.5659 0.4401 
Indegree 0.5709 1 0.2706 0.3234 
M-PR 0.5659 0.2706 1 0.7459 
KeyRank 0.4401 0.3234 0.7459 1 


(* 显 著 性 p 值 均 远 小 于 0.05。) 


5 结 语 


社会 网 络 中 关键 节点 的 识别 一 直 是 信息 科学 领域 
研究 的 重要 议题 , 然而 , 学 者 多 基于 无 符号 网 络 进行 
研究, 忽略 了 网 络 中 链接 的 正 负 属性 。 传 统 基 于 无 符 
号 网 络 设计 的 算法 在 符号 网 络 中 已 不 再 适用 ， 因此， 
本 文 基于 符号 网 络 的 相关 理论 ,从 网 络 拓扑 特征 出 发 ， 
提出 一 种 改进 的 PageRank 算法 一 一 KeyRank 算法, 用 
于 识别 符号 网 络 中 的 关键 节点 。 

改进 算法 在 PageRank 算法 的 基础 上 , 结合 基于 
中 心性 的 统计 方法 , 综合 考虑 节点 的 全 局 拓扑 特性 和 
局 部 特征 ,并 设置 参数 8 来 调节 不 同情 境 下 “全 局 ”与 
“局 部 ”对 关键 节点 识别 影响 的 比重 。 在 实证 研究 中 发 
现 , 传统 算法 与 KeyRank 算 法 在 节点 排序 上 存在 差异 ， 
说 明 链 接 的 符号 属性 对 排序 结果 产生 了 重要 影响 。 基 


A, 将 正 向 链接 和 负 向 链接 同 质 化 的 Slashdot 网 络 记 
为 Network B; 同样 地 , 吻 除 Network A 和 Network B 
中 入 度 为 0 的 节点 ; 最 后 对 PageRank 算法 、 入 度 、 

M-PR 算法 和 KeyRank 算法 ( 6 = 0.5) 的 排名 结果 进行 


数据 分 析 与 知识 发 现 


于 符号 网 络 设计 的 KeyRank 算 法 与 传统 算法 的 区 别 主 
要 体现 在 两 方面 : 一 是 更 加 关注 节点 自身 的 属性 特征 ， 
通过 考虑 人 链 数 和 入 链 性 质 识别 关键 节点 ; 二 是 对 不 
同情 境 下 节点 的 重要 程度 进行 区 分 , 一 般 地 ， 负 向 链 
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接 对 识别 关键 节点 只 产生 负面 影响 , 但 有 时 负 向 链接 
却 对 关键 节点 的 识别 具有 重要 意义 。 

在 本 研究 的 基础 上 , 未 来 可 以 重点 考虑 如 下 工作 : 

(1) 改进 KeyRank 算法 , 该 算法 仅 在 计算 节点 重 
要 度 时 考虑 了 正 负 链 接 对 节点 的 影响 , 忽略 了 每 次 迭 
代 时 正 负 链 接 的 相互 作用 。 

(2) 通过 实证 研究 ,给 定 不 同情 境 下 参数 8 的 经 
验 取 值 。B 的 取 值 视 不 同 的 网 络 结构 和 背景 信息 而 定 ， 
但 相关 情景 和 应 用 场合 的 8 值 相近 。 

(3) 在 拓扑 结构 特征 的 基础 上 , 加 入 对 符号 网 络 
中 内 容 特 征 和 行为 特征 的 考量 , 识别 关键 节点 。 拥 有 
背景 信息 的 符号 网 络 数据 还 较 难 获取 ,相关 研究 在 一 
定 程 度 上 受到 限制 。 
(4) 符号 网 络 作为 近年 来 新 兴 的 研究 热点 ， 理 论 
基础 、 研 究 方法 和 实证 环境 尚 不 成 熟 。 因 此 ， 基 于 符 
号 网 络 的 排序 、 分 类 、 聚 类 、 预 测 、 信 息 传 播 和 推荐 
等 问题 还 有 较 大 的 研究 和 发 展 空间 。 
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Identifying Key Nodes in Social Network with Improved PageRank 
Algorithm 


Chen Xiaowei Shi Yutian 
(School of Information Management, Nanjing University, Nanjing 210023, China) 


Abstract: [Objective] This paper modifies the PageRank algorithm for signed network, aiming to identify the key 
nodes in social network. [Methods] Based on the theory of signed network, we proposed the KeyRank algorithm, 
which combined the PageRank algorithm with node centrality. We examined the new algorithm with user data from the 
Slashdot website to obtain every user’s ranking. [Results] The rankings of PageRank algorithm, in-degree and M-PR 
algorithm had significant medium level positive correlation with the rankings obtained with the KeyRank algorithm. 
[Limitations] The KeyRank algorithm ignored the interactions between the positive and negative links in each iteration. 
[Conclusions] There is difference between the rankings of nodes by traditional and KeyRank algorithms. The signed 
links poses important impacts on the rankings, which shows the improved algorithm’s theoretical and practical 
significance. 
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